Jitendra Malik once said, "Supervision is the opium of the AI researcher". Most deep learning techniques heavily rely on extreme amounts of human labels to work effectively. In today's world, the rate of data creation greatly surpasses the rate of data annotation. Full reliance on human annotations is just a temporary means to solve current closed problems in AI. In reality, only a tiny fraction of data is annotated. Annotation Efficient Learning (AEL) is a study of algorithms to train models effectively with fewer annotations. To thrive in AEL environments, we need deep learning techniques that rely less on manual annotations (e.g., image, bounding-box, and per-pixel labels), but learn useful information from unlabeled data. In this thesis, we explore five different techniques for handling AEL.
translated by 谷歌翻译
数字病理学(DP)域中培训深层学习模型的危急挑战是医学专家的高注重成本。解决此问题的一种方法是通过从自然图像域(NI)的传输学习,其中注释成本显着更便宜。从NI到DP的跨域传输学习被证明通过类标签〜\ Cite {teh2020 learning}成功。依赖类标签的一个潜在弱点是缺乏空间信息,可以从空间标签获得,例如全像素 - 明智的分段标签和涂鸦标签。我们展示了来自NI域的杂文标签可以提高DP模型在两个癌症分类数据集上的性能(贴片Camelyon乳腺癌和结肠直肠癌数据集)。此外,我们展示了杂文标签培训的模型,尽管收集显着更容易和更快,但仍然具有完整像素 - 明智的分段标签的性能提升。
translated by 谷歌翻译
KL-regularized reinforcement learning from expert demonstrations has proved successful in improving the sample efficiency of deep reinforcement learning algorithms, allowing them to be applied to challenging physical real-world tasks. However, we show that KL-regularized reinforcement learning with behavioral reference policies derived from expert demonstrations can suffer from pathological training dynamics that can lead to slow, unstable, and suboptimal online learning. We show empirically that the pathology occurs for commonly chosen behavioral policy classes and demonstrate its impact on sample efficiency and online policy performance. Finally, we show that the pathology can be remedied by non-parametric behavioral reference policies and that this allows KL-regularized reinforcement learning to significantly outperform state-of-the-art approaches on a variety of challenging locomotion and dexterous hand manipulation tasks.
translated by 谷歌翻译
欧盟可能会在世界主要司法管辖区的第一个,最严格,最全面的AI监管制度中引入。在本报告中,我们询问欧盟即将对AI的法规是否会在全球范围内扩散,从而产生所谓的“布鲁塞尔效应”。在延长阿努·布拉德福德(Anu Bradford)的工作的基础上,我们概述了可能发生这种监管扩散的机制。我们认为,欧盟的AI法规会激励非欧盟国家提供的产品的变化(事实上的布鲁塞尔效应),以及它将影响其他司法管辖区采用的法规(De Jure Brussels效应)的可能性。我们侧重于拟议的欧盟AI法案,我们暂时得出结论,事实上和德国布鲁塞尔的效应都可能是欧盟监管制度的一部分。事实上的效果尤其可能是在具有AI ACT术语“高风险”的AI系统的大型美国科技公司中产生的。我们认为,即将到来的法规对于提供第一个也是最具影响力的操作,即开发和部署以可信赖或以人为本的AI意味着什么。如果欧盟政权可能会看到大量的扩散,确保其精心设计成为全球重要性的问题。
translated by 谷歌翻译
在硅组织模型中,可以评估磁共振成像的定量模型。这包括对成像生物标志物和组织微结构参数的验证和灵敏度分析。我们提出了一种新的方法来生成心肌微结构的现实数值幻影。我们扩展了以前的研究,该研究考虑了心肌细胞的变异性,心肌细胞(插入式椎间盘)之间的水交换,心肌微结构混乱和四个钣金方向。在该方法的第一阶段,心肌细胞和钣金是通过考虑心肌到骨膜细胞连接的形状变异性和插入式椎间盘而产生的。然后,将薄板汇总和定向在感兴趣的方向上。我们的形态计量学研究表明,数值和真实(文献)心肌细胞数据的体积,长度以及一级和次要轴的分布之间没有显着差异($ p> 0.01 $)。结构相关性分析证实了硅内组织与实际组织的混乱类别相同。此外,心肌细胞的模拟螺旋角(HA)和输入HA(参考值)之间的绝对角度差($ 4.3^\ Circ \ PM 3.1^\ Circ $)与所测量HA之间的绝对角差有很好的一致性使用实验性心脏扩散张量成像(CDTI)和组织学(参考值)(Holmes等,2000)($ 3.7^\ Circ \ PM6.4^\ Circ $)和(Scollan等,1998)($ 4.9) ^\ circ \ pm 14.6^\ circ $)。使用结构张量成像(黄金标准)和实验性CDTI,输入和模拟CDTI的特征向量和模拟CDTI的角度之间的角度距离小于测量角度之间的角度距离。这些结果证实,所提出的方法比以前的研究可以为心肌产生更丰富的数值幻象。
translated by 谷歌翻译
基于得分的生成模型在密度估计和生成建模任务上表现出最新的性能。这些模型通常假设数据几何形状是平坦的,但已开发出最近的扩展来合成生活在Riemannian歧管上的数据。现有的加速扩散模型采样方法通常不适用于Riemannian设置,基于Riemannian得分的方法尚未适应数据集插值的重要任务。为了克服这些问题,我们介绍了\ emph {riemannian扩散schr \“ odinger桥}。我们提出的方法概括了扩散的schr \“ \ cite {debortoli2021neurips}中引入的odinger桥,向非欧国性分数设置超出了Riemannian Score的模型,并扩展第一次逆转。我们验证我们提出的关于合成数据以及真实地球和气候数据的方法。
translated by 谷歌翻译
观察到在训练期间重新定位神经网络,以改善最近的作品中的概括。然而,它既不在深度学习实践中被广泛采用,也不经常用于最先进的培训方案中。这就提出了一个问题,即何时重新定位起作用,以及是否应与正规化技术一起使用,例如数据增强,体重衰减和学习率计划。在这项工作中,我们对标准培训的经验比较进行了广泛的经验比较,并选择了一些重新定位方法来回答这个问题,并在各种图像分类基准上培训了15,000多个模型。我们首先确定在没有任何其他正则化的情况下,这种方法对概括始终有益。但是,当与其他经过精心调整的正则化技术一起部署时,重新定位方法几乎没有给予概括,尽管最佳的概括性能对学习率和体重衰减超参数的选择不太敏感。为了研究重新定位方法对嘈杂数据的影响,我们还考虑在标签噪声下学习。令人惊讶的是,在这种情况下,即使在存在其他经过精心调整的正则化技术的情况下,重新定位也会显着改善标准培训。
translated by 谷歌翻译
离线强化学习在利用大型预采用的数据集进行政策学习方面表现出了巨大的希望,使代理商可以放弃经常廉价的在线数据收集。但是,迄今为止,离线强化学习的探索相对较小,并且缺乏对剩余挑战所在的何处的了解。在本文中,我们试图建立简单的基线以在视觉域中连续控制。我们表明,对两个基于最先进的在线增强学习算法,Dreamerv2和DRQ-V2进行了简单的修改,足以超越事先工作并建立竞争性的基准。我们在现有的离线数据集中对这些算法进行了严格的评估,以及从视觉观察结果中进行离线强化学习的新测试台,更好地代表现实世界中离线增强学习问题中存在的数据分布,并开放我们的代码和数据以促进此方面的进度重要领域。最后,我们介绍并分析了来自视觉观察的离线RL所独有的几个关键Desiderata,包括视觉分散注意力和动态视觉上可识别的变化。
translated by 谷歌翻译
上下文匪徒的大多数非政策评估方法都集中在政策的预期结果上,该方法是通过最多只能提供渐近保证的方法来估算的。但是,在许多应用中,期望可能不是最佳绩效衡量标准,因为它不会捕获结果的可变性。此外,特别是在关键安全环境中,可能需要比渐近正确性更强的保证。为了解决这些局限性,我们考虑了对上下文匪徒的保形预测的新颖应用。给定在行为策略中收集的数据,我们建议\ emph {condormal非政策预测}(COPP),该数据可以在新目标策略下为结果输出可靠的预测间隔。我们提供理论有限样本的保证,而无需做出任何其他假设,而不是标准的上下文匪徒设置,并且与现有的合成和现实世界数据相比,经验证明了COPP的实用性。
translated by 谷歌翻译
深度学习中的最新工作重新想象了数据的表示形式,因为函数从坐标空间映射到基础连续信号。当神经网络近似此类功能时,这引入了更常见的多维阵列表示的引人注目的替代方案。关于这种隐式神经表示(INR)的最新工作表明,仔细体系结构搜索 - INR可以超越建立的压缩方法,例如JPEG(例如Dupont等,2021)。在本文中,我们提出了至关重要的步骤,以使这种想法可扩展:首先,我们采用最先进的网络稀疏技术来大大改善压缩。其次,引入第一种方法,允许在常用的元学习算法的内环中使用稀疏性,从而极大地改善了压缩和学习INR的计算成本。这种形式主义的普遍性使我们能够对各种数据模式提出结果,例如图像,歧管,签名距离功能,3D形状和场景,其中一些建立了新的最新结果。
translated by 谷歌翻译